港中大团队:发现AI推理80%步骤可精简
这项由香港中文大学的李泽驹、钟建元等研究者以及华为技术有限公司的程莹莹、张帆共同完成的突破性研究,发表于2025年8月的arXiv预印本平台(论文编号:arXiv:2508.03346v1)。对这项研究感兴趣的读者可以通过https://github.com/
这项由香港中文大学的李泽驹、钟建元等研究者以及华为技术有限公司的程莹莹、张帆共同完成的突破性研究,发表于2025年8月的arXiv预印本平台(论文编号:arXiv:2508.03346v1)。对这项研究感兴趣的读者可以通过https://github.com/
2025年8月11日,截至收盘,沪指涨0.34%,报收3647.55点;深成指涨1.46%,报收11291.43点;创业板指跌1.96%,报收2379.82点。科创半导体ETF涨0.28%,半导体材料ETF涨0.18%.
近日全国多地发生行驶汽车遭雷击事件,专家提醒:雨天行车应尽快到安全区域停车,关闭音响等设备,避免接触金属物品。若车辆被雷击中,不要轻易下车,等电流传导后再处理。>> 查看详情
今日科创板早报主要内容有:北京亦庄发布“具身智能机器人十条”,全方位支持企业发展;王兴兴称,未来2-5年智能机器人的重心是大模型、低成本硬件、算力;台积电7月销售额3231.7亿元台币,同比增长25.8%;开普云筹划收购金泰克或其存储业务资产控制权。
日前,云天励飞发布公告,公司已向香港联交所递交了发行境外上市股份(H股)并在港交所主板挂牌上市的申请。这意味着,继 2023 年登陆科创板之后,云天励飞正迈向 “A+H” 双重上市的新阶段,加快国际化资本布局。
这项由ByteDance Seed、清华大学智能产业研究院、香港大学以及清华AIR-ByteDance联合实验室的研究团队开发的突破性成果发表于2025年3月,论文全称为《DAPO: An Open-Source LLM Reinforcement Learn
这项由加州大学圣地亚哥分校胡志廷教授与Mohamed bin Zayed人工智能大学、卡内基梅隆大学、普渡大学等多家顶尖学府合作完成的研究,发表于2025年6月的国际机器学习会议(arXiv:2506.14965v1)。这个庞大的研究团队包括来自各大学的21位
Melius Research分析师Benjamin Reitzes发表研报表示,看好AMD(AMD.US)在人工智能(AI)推理领域的增长潜力,将该股评级从“持有”上调至“买入”,目标价从110美元上调至175美元。
这项由MiniMax公司研究团队发表于2025年6月的突破性研究,介绍了世界首个开源的大规模混合注意力推理模型MiniMax-M1。这份发表在arXiv平台的论文(编号:arXiv:2506.13585v1),为有兴趣深入了解的读者提供了完整的技术细节和实验数
在人工智能的世界里,有一个非常重要的发现正在改变我们对AI推理能力的理解。这项由微软研究院牵头,联合香港大学、华中科技大学、北京大学和清华大学的研究团队于2025年6月发表的突破性研究,为我们揭示了如何让AI模型在进行复杂推理时变得更加高效。感兴趣的读者可以通
尽管NVIDIA的市值目前稳居美国股市前三,但其市场地位已经不如之前那么稳固。一个标志性的事件,是Google使用TPU芯片(张量处理单元),训练出了Gemini 2.5 Pro这个SOTA通用模型,打破了SOTA模型主要由NVIDIA GPU训练的垄断。
这项由NVIDIA公司的Adrian Lańcucki、Konrad Staniszewski,以及爱丁堡大学的Piotr Nawrot和Edoardo M. Ponti共同完成的突破性研究,于2025年6月发表在计算机学习领域的顶级期刊上。有兴趣深入了解技术
与常规3D打印机不同,投影式生物打印机的“墨盒”里装的是含有活细胞的“生物墨水”。当打印机工作时,它像“投影仪”一样逐层变换图案照射生物墨水,让材料在光照下快速凝固成型。
现在,国内终于有了自己的 RunPod—— 共绩云 AI 推理 Serverless 平台 ,不仅支持极简快速部署,而且超级低价 —— RTX 4090 最高 只要 1.68 元/小时 ,还能按毫秒计费、自动扩容,真正做到了 “随用随租”。
推理 清华 创业团队 ai推理 推理serverlessgp 2025-05-28 18:17 9
Gartner预计,到2028年,80%以上的算力将用于推理而不是训练。与此同时,随着推理模型日益复杂和规模不断扩大,其对资源需求的持续攀升限制了集中式推理的可行性,并有可能因成本过高和延迟过长而使AI创新陷入瓶颈。
红帽公司近日宣布,与CoreWeave、Google Cloud、IBM Research及NVIDIA等业界巨头联手,正式启动了一项名为llm-d的全新开源项目。该项目致力于解决生成式人工智能(AI)在大规模推理方面的迫切需求。
近日,红帽公司宣布推出红帽企业Linux 10以及启动全新开源项目llm-d,以满足生成式AI(gen AI)未来最关键的需求:大规模推理。
本文将深入探讨AI推理领域面临的核心挑战,并介绍中国首个专注AI推理的Serverless产品——共绩算力AI推理Serverless平台。我们将解析其技术亮点、背后源自清华的创业团队力量,以及其如何以创新的价格策略,打造中国版的RunPod,赋能广大开发者与
推理 gpu 普惠 serverless ai推理 2025-05-26 10:59 9
红帽公司近期揭晓了其最新力作——红帽AI推理服务器,该产品旨在混合云环境中为用户提供兼具高效与经济性的AI推理解决方案。通过融合尖端的vLLM技术和Neural Magic的创新优势,红帽力图在响应速度和性能表现上为用户带来显著提升。
本周在波士顿举行的红帽峰会上发布的这款全新 AI 推理服务器软件,基于开源 vLLM project 开发,并融合了红帽近期收购初创公司 Neural Magic 的技术成果。